越来越担心的是,生成的AI模型将产生与受过训练的版权材料相似的产出。由于生成模型的质量和复杂性得到了极大的改进,并且包含受版权保护材料的广泛数据集的可用性已经扩大。研究人员正在积极探索策略,以减轻产生侵权样本的风险,最近的工作表明采用了诸如差异隐私和其他形式的算法稳定性之类的技术,以保证缺乏侵权副本。在这项工作中,我们检查了这种算法 - MIC稳定性技术是否适合确保负责使用生成模型而不会无意中违反版权法。我们认为,尽管这些技术旨在验证数据集中可识别的信息的存在,因此,版权法旨在促进使用原始作品以使整个社会受益的原始作品,但前提是不会出现对受保护表达的非无意义使用。不得忽略隐私和版权之间的这些根本差异。特别是,我们证明算法稳定性可能被视为检测复制的实用工具,但这种复制并不一定构成侵犯版权。因此,如果通过作为检测建立版权侵权的标准,算法稳定性可能会破坏版权法的预期目标。
主要关键词
![arxiv:2305.14822v2 [cs.lg] 2024年3月24日PDF文件第1页](/bimg/0/085c98d92b31743c4c5d72cb9404722bc8032c5b.webp)
![arxiv:2305.14822v2 [cs.lg] 2024年3月24日PDF文件第2页](/bimg/1/132568dda0e8abb785eca19898e1783659499e3e.webp)
![arxiv:2305.14822v2 [cs.lg] 2024年3月24日PDF文件第3页](/bimg/b/ba6767a0dd0302628ba64dc08d065c46473b8c1e.webp)
![arxiv:2305.14822v2 [cs.lg] 2024年3月24日PDF文件第4页](/bimg/c/c1b9ead76768844b2a9631d3be0af2deb45ee498.webp)
![arxiv:2305.14822v2 [cs.lg] 2024年3月24日PDF文件第5页](/bimg/8/86072d3585112886349314a344d96b95dedfdf54.webp)
